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Titel: Rekonf igurierbare Sequenzerstruktur 



Beschreibung 



Die vorliegende Erfindung betrifft ein Zellelementef eld und : 
ein Verfahren zum Betrieb desselben. Damit befaflt sich die 
vorliegende Erf indung insbesondere mit rekonf igurierbaren Da- 
10 tenverarbeitungsarchitekturen . 

CL- Unter einer rekonf igurierbaren Architektur werden u. a. Bau- 

steine (VPU) verstanden, die eine Vielzahl in Funktion 
und/oder Vernetzung im Betrieb veranderliche Elemente aufwei- 

15 sen. Zu den Elementen konnen arithmetische Logikeinheiten, 
FPGA-Bereiche, Ein-Ausgabezellen, Speicherzellen, analoge 
Baugruppen usw. gehoren. Bausteine dieser Art sind beispiels- 
weise unter der Bezeichnung VPU bekannt. Diese umfalit typisch 
als PAEs bezeichnete ein- oder mehrdimensional angeordnete 

20 arithmetische und/oder logische und/oder analoge und/oder 

speichernde und/oder vernetzende Baugruppen und/oder kommuni- 
kative periphere Baugruppen (10) , die direkt oder durch einen 
oder mehrere Bussysteme miteinander verbunden sind. Die PAEs 
sind in beliebiger Ausgestaltung, Mischung und Hierarchie an- 

25 geordnet, wobei die Anordnung als PAE-Array oder kurz PA be- 
zeichnet wird. Es kann dem PAE-Array eine konf igurierende 
Einheit zugeordnet sein. Prinzipiell sind neben VPU-Bau- 
steinen auch systolische Arrays, neuronale Netze, Mehrprozes- 
sorsysteme, Prozessoren mit mehreren Rechenwerken und/oder . 

30 logischen Zellen, Vernetzungs- und Netzwerkbausteine wie 
Crossbar-Schaltung usw. bekannt, genauso wie FPGAs , DPGAs , 
Transputer usw. 
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Es wird darauf hingewiesen, dass. wesentliche Aspekte der VPU- 
Technik z. B. in den folgenden Schutzrechten desselberi Anmel- 
ders sowie den zugehorigen Nachanmeldungen zu den aufgefiihr- 
ten Schutzrechten beschrieben sind: 

5 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2,. 
DE 196 54 846.2-53, DE 196 54 593.5-53, DE 197 04 044.6-53, 
DE 198 80 129.7, DE 198 61 088.2-53, DE 199 80 312.9, 
PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 
10 DE 101 10 530.4, DE 101 11 014.6, PCT/.EP 00/10516, 
EP 01 102 674.7, DE 102 06 856.9, 60/317,876, 
ft ) DE 102 02 044.2, DE 101 29 237.6-53, DE 101 39 170.6. 

Es sei darauf hingewiesen, dass die vorgenannten Dokumente zu 
15 Of f enbarungszwecken insbesondere hinsichtlich Besonderheiten 
und Details der Vernetzung, Konf iguration, Ausgestaltung von 
Architekturelementen, Triggerverf ahren usw . eingegliedert 
sind. 

20 Die Architektur hat beachtliche Vorteile gegenuber herkommli- 
chen Prozessorarchitekturen, soweit damit Datenverarbeitung 
in einer Art und Weise erfolgt, die hohe Anteile an paralie- 
(|~~/ len und/oder vektoriellen Datenverarbeitungsschritten be- 

sitzt. Die Vorteile der Architektur gegenuber anderen Prozes- 
25 sor-, Coprozessor- oder generell Datenverarbeitungseinheiten 
werden jedoch geringer, wenn sich die Vorteile der Vernetzung 
und der gegebenen prozessorarchitektonischen Besonderheiten 
nicht mehr in vollem Umfange realisieren lassen.. 

30 Dies ist besonders dann der Fall, wenn Datenverarbeitungs- 

schritte abzuarbeiten sind, die herkommlich am besten auf Se- 
quenzer-Strukturen abgebildet werden konnen. Es ist wun- 
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schenswert, die rekonf igurierbare Architektur derart auszuge 
stalten und zu verwenden, dass auch typisch mit Sequenzern 
besonders gut abzuarbeitende Datenverarbeitungsschritte be- 
sonders schnell und effizient abgearbeitet werden konnen. 

5 

Die Aufgabe der vorliegenden Erfindung besteht darin, Neues 
fur die gewerbliche Anwendung bereitzustellen. 

Die Losung dieser Aufgabe wird unabhangig beansprucht. Bevor 
10 zugte Ausf uhrungsf ormen finden sich in den Unteranspriichen. 

C) Gemafi . einem ersten wesentlichen Aspekt der Erfindung wird so 

mit bei einem in Funktion und/oder Vernetzung insbesondere 
zur Laufzeit ohne Storung nicht rekonf igurierter Elemente re 

15 konf igurierbaren Zellementef eld zur Datenverarbeitung mit 

insbesondere grobgranularen Funktionszellmitteln zur Ausfiih- 
rung algebraischer und/oder logischer Funktionen und Spei- 
cherzellmitteln, um Information zu empfangen, abzuspeichern 
und/oder auszugeben, vorgeschlagen, dass Funktionszellen- 

20 Speicherzellenkombinationen gebildet sind, bei denen von den 
Funktionszellmitteln eine Steuerverbindung zu den Speicher- 
zellmitteln gefuhrt ist. Diese Steuerverbindung dient dazu, 
die Adress- und/oder' Dat^neih/ausgabe aus dem Speicher durch 
die zugeordnete Funktionszelle, typisch einer ALU-PAE, steu- 

25 erbar zu machen. So kann etwa angegeben werden, ob die nach- 
ste ubertragene Information als Adresse Oder als Daten behan- 
delt werden soil und ob ein Lese- und/oder Schreibzugrif f er- 
forderlich ist. Diese Ubertragung von Daten aus der Speicher- 
zelle beziehungsweise den Speicherzellmitteln, bei der es 

30 sich etwa um eine RAM-PAE handeln kann, auf die Funktions- 
zellmittel, bei denen es sich etwa um eine ALU-PAE handeln 
kann, erlauben dann, dass neue, von der ALU abzuarbeitende 
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Befehle in diese geladen werden konnen . Es sei darauf hinge- 
wiesen, dass Funktionszellmittel. und Speicher zellmittel durch 
Integration in eine str.ukturelle Einheit zusammengef asst wer- 
den konnen. In einem solchen Fall ist es moglich, einen ein- 
5 zigen Busanschluss zu verwenden, . urn Daten in die Speicher- 
zellmittel und/oder die ALU einzufuhren. Es. konnen dann ge- 
eignete Eingangsregister und/oder Ausgangsregister vorgesehen 
sein und, falls gewiinscht, hiervon verschiedene zusat zliche 
Daten- und/oder Konf igurationsregister als Speicherzellmit- 
10 tel. 

Es sei auch erwahnt, dass es moglich ist, ein Zellelemente- 
feld aufzubauen, das eine Vielzahl unterschiedlicher Zellen 
bzw. Zellengruppen enthalt, wobei bevorzugt mit den unter- 

15 schiedlichen Zellen Streifen oder dergleichen regulare Muster 
vorgesehen werden, da diese sehr regulare Anordnung ermog- 
licht, den hardwaretechnischen Aufbau und den Betrieb glei- 
chermalien zu erleichtern. Bei einem solchen streif enartigen 
oder anderen regularen Aufbau aus einer geringen Mehrzahl an 

20 unterschiedlichen Zellelementen konnen beispielsweise Elemen- 
te mit integrierten Funktionszellmittel-Speicherzellmittel- 
kombinationen, das heisst Zellen, in denen Funktionszell- und 
Speicheirzellmittel gemafi der Erfindung integriert sind, zen- 
tral im Feld vorgesehen werden, wo typisch nur wenige unter- 

25. schiedliche Programmschritte innerhalb einer Sequenzerstruk- 
tur abzuarbeiten sind, weil dies, wie erkannt wurde, fur her- 
kommliche Datenstromanwendungen sehr gute Ergebnisse gibt, 
wahrend an den Feldrandern komplexere Sequenzerstrukturen 
aufgebaut werden konnen, bei denen etwa eine ALU-PAE> die ei- 

30 ne separate Einheit darstellt, neben einer separaten RAM-PAE 
und gegebenenf alls einer Reihe I/O-PAEs unter Verwendung bzw. 
Anordnung entsprechender Steuerleitungen oder Verbindungen 
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derselben angeordnet werden konnen, weil dort oftmals mehr 
Speicher benotigt wird, etwa urn. im Feldzentralbereich des 
Z e lie lementef e Ides erzeugte Ergebnisse zwischenzuspeichern 
und/oder fur das Datenstromen durch dieses benotigte Daten 
5 vorabzulegen und/oder entsprechend auf zubereiten . 

Wenn, etwa in der Feldmitte, Zellen vorgesehen werden, die 
Speicherzellmittel und Funktionszellmittel integrieren, so 
kann in diesen ein kleiner Speicher fur verschiedene, von den 

10 Funktionzellmittel wie der ALU auszuf uhrende Befehle vorgese- 
hen sein. Es ist hier insbesondere moglich, den Befehls- be- 
^ .3 ziehungsweise Konf igurationsspeicher zu trennen von einem Da- 

tenspeicher, und es ist moglich, den Funktiohsspeicher so 
grofi auszubilden, dass alternativ eine von mehreren, bei- 

15 spielsweise zwei, unterschiedlichen Sequenzen abgearbeitet 
werden kann. Die jeweils abzuarbeitende Sequenz kann im An- 
sprechen auf in der Zelle generierte Ergebnisse und/oder in 
die Zelle von auJJen eingehende Steuersignale, wie Carry, 
Overflow- usw. Triggersignale erfolgen. Auf diese Weise wird 

20 diese Anordnung auch verwendbar fur Verfahren der Wave- 
Rekonf iguration . 

CL * Es ist auf diese Weise moglich, lediglich durch Vorsehen ei- 

ner dedizierten und dediziert f unktionszellenkontrollierten 

25 Steuerverbindung zwischen Funktionszelle bzw. Funktionszell- 
mittel und Speicherzelle bzw. Speicherzellmittel bereits mit 
nur zwei Elementen, die liber geeignete Busse verbunden sind, 
eine Sequenzerstruktur in einem Zellelementef eld aufzubauen, 
ohne dass ansonsten weitere Malinahmen und/oder bauliche Ver- 

30 anderungen erforderlich sind. In der Speicherzelle konnen Da- 
ten, Adressen, Programmschritte usw. in per se aus herkommli- 
chen Prozesspren bekannter Weise abgelegt werden. Weil beide 
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10 



El entente auch in anderer Welse bei entsprechender Konfigura- 
tion einsetzbar sind, ergibt sich eine besonders effiziente 
Bauweise, die sowohl Sequenzerstrukturen als auch vektoriel- 
len und/oder parallelisierbaren Strukturen besonders gut an- 
pafibar ist. So konnen allein durch geeignete PAE-Ausgestal- 
tungen Parallelisierungen unterstutzt werden, etwa durch das 
Vorsehen von in zwei unterschiedliche raumliche Richtungen 
arbeitende PAEs und/oder durch mit Datendurchschleuseregi- 
stern versehene Zelleinheiten . 



Es ist einsichtig, dass durch die Verwendung von lediglich 
C~) zwei Zellen in einem Zellelementef eld, namlich der Funktions- 

zelle und der Inf ormationsbereitstellungszelle eine Vielzahl 
von sequenzerartigen Strukturen in dem rekonf igurierbaren 

15 Zellelementef eld aufgebaut werden kann. Dies ist insofern 
vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
einem multitaskingf ahigen Betriebssystem, eine Reihe unter- 
schiedlicher und voneinander per se verschiedener Aufgaben 
abgearbeitet werden muii . Es konnen dann eine Vielzahl derar- 

20 tiger Aufgaben in einem einzigen Zellelementef eld effektiv 
gleichzeitig abgearbeitet werden. Die Vorteile fur Echt- 
zeitanwendungen sind of f ensichtlich . Weiter ist es auch mog- 
lich, die einzelnen Sequenzerstrukturen, die in einem Zeille- 
lementefeld unter Vorsehung der erf indungsgemalien Steuerver- 

25 bindung aufgebaut werden, mit unterschiedlichen Taktraten zu 
betreiben, etwa um den Stromverbrauch dadurch zu senken, dass 
Aufgaben mit geringerer Prioritat langsamer abgearbeitet wer- 
den. Es ist uberdies moglich, bei der Ausfuhrung per se weit- 
gehend paralleler Algorithmen sequenzerartige Programmteile 

30 in dem Feld parallel oder vektoriell abzuarbeiten und umge- 
kehrt. 
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Typisch wird jedoch bevorzugt sein, dass sequenzerartige 
Strukturen im Zellelementef eld, seien es sequenzerartige 
Strukturen mit in einem durch Verbindung mit Nachbarzellen 
oder Bussen verbundenen. Bereich oder seien es Kombinationen 
5 aus raumlich unterscheidbaren, separaten und audi separat 
verwendbaren Funktionszellelementen, wie ALU-PAEs und Spei- 
cherzellelementen wie RAM-PAEs, hoher getaktet werden. Dies 
hat den Vorteil, dass sequenzielle Programmteile, die sich 
allenfalls sehr schlecht parallelisieren lassen, in einer . 

10 allgemeinen Datenf lussverarbeitung einset zen lassen, ohne 
dass die Gesamtdatenverarbeitung beeintrachtigt wird. Bei- 
spiele hierfur sind etwa gegeben durch eine HUFFMANN-Co- 
dierung, die wesentlich besser sequenziell als parallel abar- 
beitbar 1st und die zugleich fur Anwendungen wie die MPEG4- 

15 Codierung eine wichtige Rolle spielt, wobei aber die wesent- 
lichen anderen Teile der MPEG4-Codierung gut parallelisierbar 
sind. Es wird dann eine parallele Datenverarbeitung fur die 
meisten Teile eines Algorithmus verwendet und ein sequenziel- 
ler Abarbeitungsblock darin vorgesehen . Typisch wird eine Er- 

20 hohung der Taktfrequenz im Sequenzerbereich urn einen Faktor 2 
bis 4 schon ausreichend sein. 

Es sei erwahrit, dass an Stelle einer streif enartigen Anord- 
nung unterschiedlicher Zellelemente auch eine andere, insbe- 
25 sondere multidimensionale Gruppierung gewahlt werden kann. 

Das Zellelementef eld mit den in Funktion und/oder Vernetzung 
konf igurierbaren Zellen kann einsichtigerweise einen Prozes- 
s.or, einen Coprozessor und/oder einen Mikrocontroller bilden, 
30 bzw. eine parallele Vielzahl oder Kombinationen derselben. 
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C) 



Die Funktionszellen sind typisch als arithmetische Logikein- 
heiten gebildet, wobei sie insbesondere grobgranulare Elemen- 
te darstellen, die aber z. B. mit einer f eingranularen State- 
machine versehen sein konnen. In einem besonders bevorzugten 
Ausf iihrungsbeispiel handelt es sich bei den ALUs urn sogenann- 
te erweiterte ALUs (EALU) , wie diese in den fruheren Anmel- 
dungen des vorliegenden Anmelders beschrieben wurden. Eine 
Erweiterung kann insbesondere die Steuerleitungskontrolle, 
Bef ehlsdekodiereinheit etc. umfassen, soweit erf orderlich. . 



10 



Die Speicherzellen konnen Daten und/oder Inf ormationen fliich- 
tig und/oder nichtf liichtig speichern. Wenn in den Speicher- 
zellen abgelegte Inf ormationen, seien es Programmschritte, 
Adressen fur einen Zugriff auf Daten oder registerartig bzw . 
15 heap-artig abgelegte Daten als fluchtige Daten abgelegt sind, 
so kann eine vollstandige Rekonf iguration wahrend des Betrie- 
bes erfolgen. Alternativ ist es moglich, nichtf liichtige Spei- 
cherzellen vorzusehen. Die nichtf luchtigen Speicherzellen 
konnen etwa als EE-Prom-Bereich und dergleichen vorgesehen 
20 werden, in die ein rudimentares Bios-Programm abgelegt wird, 
das bei Inbetriebnahme der Anordnung auszufiihren ist. Auf 
diese Weise kann ohne weitere Bauteile eine Inbetriebnahme 
(f~l einer Datenverarbeitungseinrichtung erfolgen. Ein nichtfluch- 

tiger Datenspeicher kann auch dann vorgesehen werden, wenn 
25 aus Kosten- und/der Raumgriinden beschlossen wird, dass immer 
wieder dieselben Programmteile auszufuhren sind, wobei auch 
unter solch festen Programmteilen, etwa nach Art der WAVE- 
Rekonf iguration, im Betrieb gewechselt werden kann. Die Mog- 
lichkeiten, derartige nichtf luchtige Speicher vorzusehen. und 
30 zu verwenden, sind Gegenstand anderer Schutzrechte des Anmel- 
ders. Es ist moglich, sowohl fluchtige als auch nichtf liichti- 
ge Daten in den Speicherzellen abzuspeichern., etwa um 
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ein Bios-Programm fest abzulegen und die Speicherzelle den- 
noch fiir andere Zwecke nutzen zu konnen. 



Die Speicherzelle ist bevorzugt so ausgebildet, dass sie eine 
5 hinreichende Vielzahl von zu verarbeitenden Daten und/oder 
abzuarbeitenden Programmteilen speichern kann. Es sei dabei 
darauf hingewiesen, dass diese Programmteile sowohl als Pro- 
grammschritte ausgebildet sein konnen, die jeweils vor.geben, 
was eine einzelne, insbesondere die zugeordnete PAE, also . 

10 insbesondere die die Speicherzelle steuernde Funktionszelle, 
im nachsten Schritt zu tun hat, als auch ganze Konf iguratio- 
C) nen fiir Feldbereiche oder andere Felder beinhalten kann. In 

einem solchen Fall ist es ohne weiteres moglich, dass die 
aufgebaute Sequenzerstruktur einen Befehl ausgibt, auf Grund 

15 dessen eine Rekonf iguration von Zellelementef eldbereichen er- 
folgt. Damit arbeitet die diese Konf iguration auslosende 
Funktionszelle dann zugleich als Ladelogik. Es sei darauf 
hingewiesen, dass die Konf iguration von anderen Zellen wie- 
derum dergestalt erfolgen kann, dass dort eine sequenzerarti- 

20 ge Datenverarbeitung erfolgt und es ist in diesen Feldern 

wiederum moglich, andere Zellen im Verlauf der Programmarbei- 
tung zu konf igurieren bzw. rekonf igurieren . Damit ergibt sich 
(C^) ein iteratives Konf igurieren von Zellelementebereichen und es 

ist ein Einschachteln von Programmen mit Sequenzer- und Pa- 

25 rallel-Strukturen moglich, die ahnlich ineinander geschach- 
telt sind wie eine Babuschka. Es sei darauf hingewiesen, dass 
hier insbesondere durch Ein-Ausgabezellen ein Zugriff auf 
weitere Zellelementef elder auiierhalb eines einzelnen inte- 
grierten Bausteihes erfolgen kann, was die Gesamtrechenlei- 

30 stung massiv erhohen kann. Es ist insbesondere moglich, bei 
Auftreten von Konf igurationen in einem Codeteil einer in ein 
Zellelementef eld hineinkonf igurierten Sequenzerstruktur gege- 
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benenfalls entweder die Konf igurationsanf orderungen auf einem 
zugewiesenen Zellelementef eld, das von der jeweiligen Sequen- 
zerstruktur allein verwaltet wird, durchzuf uhren und/oder es 
konnen derartige Anf orderungen an eine Konf igurations- 
5 Mastereinheit abgegeben werden, urn sicherzustellen, dass eine 
gleichmafiige Belegung aller Zellelementef elder erfolgt. Es 
ergibt sich somit quasi ein Unterprogrammauf ruf durch Uberga- 
' be von erf orderlichen Konf igurationen an Zellen oder Ladelo- 
giken. Dies wird fur sich als schutzwtirdig angesehen. Es sei . 

10 auch darauf hingewiesen, dass die Zellen, sofern sie selbst 
fur die Konf iguration anderer Zellelementf eldbereiche Zustan- 
digkeit besitzen, mit hard- oder sof twareartig implementier- 
ten FILMO-Strukturen und dergleichen zur Sicherstellung einer 
ordnungsgemalien Rekonf iguration versehen sein konnen. Auf die 

15 Moglichkeit, die Speicherzellen wahrend der Abarbeitung von 
Befehlen derart zu beschreiben, dass sich der abzuarbeitende 
Code bzw. das abzuarbeitende Programm andert, sei hingewie- 
sen. In einer besonders bevorzugten Variante ist diese Art 
der Selbstmodif ikation (SM) aber durch eine entsprechende 

20 Steuerung uber die Funktionszelle unterdruckt. 

Es ist moglich, dass die Speicherzelle abgespeicherte Infor- 
mation :auf die An steuerung der sie steuernden Funktionszelle, 
hin direkt oder indirekt auf einen zur Funktionszelle flihren- 

25 den Bus gibt. Die indirekte Ausgabe kann insbesondere dann 
erfolgen, wenn beide Zellen benachbart liegen und die durch 
Ahsteuerung angeforderte Information an die ALU-PAE uber ein 
Bussegment eintreffen muU, das nicht unmittelbar mit dem Aus- 
gang der Speicherzelle verbunden werden kann. In einem sol- 

30 chen Fall kann die Speicherzelle Daten auf dieses Bussystem 
insbesondere uber Ruckwartsregister (Backward-Register) aus- 
geben. Es ist daher bevorzugt, wenn zumindest eine von Spei- 
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cherzelle und/oder Funktionszelle ein solches Backward- 
Register aufweist, welches im Inf ormationsweg zwischen Spei- 
cherzelle und Funktionszelle angeordnet werden kann. Diese 
Register brauchen in einem solchen Fall nicht zwingend mit 
5 weiteren Funktionalitaten versehen sein, obwohl dies etwa bei 
Anforderung von Daten aus der Speicherzelle fur die weitere 
Verarbeitung, entsprechend einem herkommlichen LOAD-Befehl 
eines typischen Mikroprozessors, zur Veranderung der Daten 
noch vor dem Hineinladen in die PAE ohne weiteres denkbar 
10 ist, urn z. B. einen Befehl LOAD++ zu realisieren. Die Daten- 
durchleitung durch in umgekehrter Richtung arbeitende ALUs 
C I und dergleichen aufweisende PAEs sei erwahnt. 

Die Speicherzelle wird bevorzugt dazu angeordnet sein, Infor- 

15 mationen von der sie steuernden Funktionszelle zu empfangen, 
wobei auch weiter ein Inf ormationseinspeichern iiber eine Ein- 
Ausgabezelle und/oder eine die Speicherzelle nicht steuernde 
Zelle moglich ist. Insbesondere dann, wenn Daten von einer 
Ein-Ausgabezelle in die. Speicherzelle geschrieben werden sol- 

20 len, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O- 
PAE) von der Funktionszelle gesteuert wird. Dabei kann etwa 
die Adresse, bei welcher eine in die Speicherzelle zu schrei- 
) behde oder gegebenenf alls : auch direkt an die Funktionszelle 

(PAE) iibertragene Information zu lesen ist f an die I/O-PAE 

25 von der ALU-PAE ubermittelt werden. Es sei in diesem Zusam- 
menhang darauf hingewiesen, dass diese Adresse uber eine 
Adreftubersetzungstabelle (Adresstranslationtable) , einen 
Adresstranslationbuf f er oder eine MMU-artige Struktur in der 
I/O-PAE festgelegt werden kann. Es ergeben sich in einem sol- 

30 chen Fall die vollen Funktionalitaten typischer Mikroprozes- 
soren. Dass sich. auch eine I/O-Funktionalitat mit einem Funk- 
tionszellmittel^ einem Speicherzellmittel und/oder einer 
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Funkt ions zellmittel-Speicherzellmittel-Kombinat ion integrie- 
ren lasst, sei erwahnt. 

Der ^Combination von Funktionszellen und Speicherzellen, sei 
5 es als integrierte Funktionszellen- und Speicherzellen-Kom- 
bination oder als aus separaten Einheiten aufgebaute Funk- 
tionszellen- und Speicherzellen-Kombination ist demnach in 
einer bevorzugten Variante zumindest ein Ein-Ausgabe-Mittel 
zugeordnet, mit welchem dann an eine externe Einheit, eine. 
10 andere Funktionszelle, Funktionszellen- Speicherzellen- 
Kombination und/oder Speicherzellen Information gesandt 
und/oder von dieser empfangen werden kann. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleichfalls zum 
15 Empfang von Steuerbef ehlen aus der Funktionszelle bzw. vom 
Funktionszellmittel ausgebildet . 

In einer bevorzugten Variante ist die Steuerverbindung dazu 
ausgebildet, zumindest einige und bevorzugt alle der nachfol- 
20 genden Befehle zu ubertragen: 

OPCODE FETCH, 

DATA WRITE INTERN, 

DATA WRITE EXTERN, 
25 DATA READ INTERN, 

DATA READ EXTERN, 

ADRESS POINTER WRITE INTERN, 

ADRESS POINTER WRITE EXTERN, 

ADRESS POINTER READ INTERN, 
30 ADRESS POINTER READ EXTERN, 

PROGRAMMPOINTER WRITE INTERN, 

PROGRAMMPOINTER WRITE EXTERN, 
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PROGRAMMPO INTER READ INTERN, 
PROGRAMMPOINTER READ EXTERN, 
STACKPO INTER WRITE INTERN, 
STACKPOINTER WRITE EXTERN, 
STACKPOINTER READ INTERN, 
STACKPOINTER READ EXTERN, 
PUSH, 
POP, 

PROGRAMMPOINTER INCREMENT. 



Dies kann durch eine entsprechende Bitbreite der Steuerlei- 
tung und eine zugeordnete Decodierung bei den Empfangern er- 
folgen. Die jeweils erf orderlichen Steuer- und Decodiermittel 
konnen problemfrei und kostengunstig vorgesehen werden. Wie 
15 ersichtlich, ergibt sich mit den Befehlen eine praktisch 

vollstandige Sequenzerf ahigkeit der Anordnung. Dass auf diese 
Weise eine Allgemeinzweckprozessordatenverarbeitungseinheit 
erhalteh wird, sei erwahnt. 



20 Die Anordnung wird typisch so gewahlt sein, dass die Funkti- 
onszelle als alleiniger Master auf die Steuerverbindung 
und/oder ein als Steuerverbindung dienendes Bussegraent bzw. 
Bussystem zugreif en kann. Es ergibt sich somit eine Anord- 
nung, bei der die Steuerleitung als Command-Leitung wirkt, 

25 wie sie in herkommlichen Prozessoren vorgesehen ist. 

Die Funktionszelle und die Speicherzelle bzw. I/O-Zelle sind 
bevorzugt benachbart angeordnet. Unter benachbart kann dabei 
wie bevorzugt verstanden werden, dass die Zellen unmittelbar 
30 nebeneinander angeordnet sind. Unmittelbar bedeutet insbeson- 

4 

dere eine Kombination solcher Zellen zu integrierten Einhei- 
ten, die wiederholt auf dem Zellelementef eld bzw. als Teil 



- 13 - 



A-kte: PACT 3 4 /PCTEac ™- 




desselben vorgesehen werden, um das Feld zu bilden. Es kann 
damit eine integrale Einheit aus Speicher- uhd Logikzellen 
gemeint sein. Alternativ befinden sie sich zumindest dicht 
beieinander. Die Anordnung der Furiktions- und Speicherzellen 
5 in integrierter bzw. enger Nachbarschaf t zueinander sorgt da- 
fur, dass keine, jedenfalls keine signif ikanten Latenzzeiten 
zwischen Ansteuerung und Dateneingang der angef orderten In- 
formation in der Funktionszelle auftreten, nur weil die Ver- 
bindungen zwischen den Zellen zu lang sind. Dies sei als „di- 

10 rekt" verstanden. Mussen Latenzzeiten berucksichtigt werden, 
so kann auch ein Pipelining in den Sequenzerstrukturen vorge- 
sehen werden. Dies wird besonders wichtig bei sehr hoch ge- 
takteten Anordnungen. Es sei darauf hingewiesen, dass es ohne 
weiteres moglich ist, entsprechend hochfrequent getaktete 

15 Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprechend schnell auf geeignete Speicherzel- 
len zugreifen konnen . Auch in einem solchen Fall, etwa wenn 
per se bekannte Architekturelemente fur die Funktionszellen 
verwendet werden, wird gleichzeitig eine Rekonf igurierbarkeit 

20 des Funktionszellenelementes und der zugehorigen Vernetzungen 
vorzusehen sein. In einer besonders bevorzugten Variante sind 
die Funktionszellen, die Inf ormationsbereitstellungs zellen 
wie Speicherzellen, 1/O-Zellen und dergleichen multidimensio- 
nal angeordnet, insbesondere nach Art einer Matrix bzw. auf 

25 Gitterpunkten eines eindimensionalen Gitters usw. Wenn eine 
regelmaflige Struktur vorliegt, wie dies dort der Fall ist, 
wird einer Zelle typisch aus einer ersten Reihe Information, 
das heifit Operanden, Konf igurationen, Triggersignale usw. zu- 
gefiihrt, wahrend in einer darunterliegende Reihe Daten, Trig- 

30 gersignale und andere Inf ormationen abgegeben werden. In ei- 
nem solchen Fall wird es bevorzugt sein, wenn die Zellen in 
ein und derselben Reihe liegen und es kann dann der Informa- 



- 14 - 



Akte : PACT34/PCTEac 



tionstransfer aus der Inf ormationsbereitstellungszelle in den 
erforderlichen Eingang der Funktionszelle uber ein Backward- 
Register erfolgen. Die Moglichkeit, die Register fur Pipeli- 
ning zu benutzen, sei erwahnt . 

5 

Es wird weiter Schutz beansprucht fur ein Verfahren zum. Be- 
trieb eines Zellelementef eldes , insbesondere multidimensiona- 
len Zellelementef eldes mit Funktionszellen zur Ausftihrung al- 
gebraischer und/oder logischer Funktionen und Inf ormationsbe- 

10 reitstellungszellen, insbesondere Speicher zellen und/oder 

Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Infor- 
) mationen und/oder Speichern derselben, wobei zumindest eine 

der Funktionszellen Steuerbef ehle an zumindest eine Informa- 
tionsbereitstellungszelle ausgibt, dort im Ansprechen auf die 

15 Steuerbef ehle Information fur die Funktionszelle bereitge- 
stellt wird und die Funktionszelle dazu ausgebildet ist, die 
weitere Datenverarbeitung im Ansprechen auf die bereitge- 
stellte Information durchzuf tihren, um so zumindest zeitweise 
sequenzerartig Daten zu verarbeiten. 

20 

Es wird also in einem rekonf igurierbaren Feld durch die Aus- 
gabe der Steuerbef ehle an die Speicherzelle einer Sequenzer- 
CCT^ struktur eine sequenzerartige Datenverarbeitung ermoglicht. 

Die Befehle, die als Steuerbef ehle von der Funktionszelle 

25 ausgegeben werden konnen, ermoglichen dabei einen sequenzer- 
artigen Betrieb, wie er aus herkommlichen Prozessoren bekannt 
ist. Es sei darauf hingewiesen f dass es ohne weiteres moglich 
ist / nur Teile der oben genannten Befehle zu implementieren 
und dennoch eine vollstandig sequenzerartige Datenverarbei- 

30 tung zu gewahrleisten . 
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Die Erfindung wird im folgenden und beispielsweise anhand der 
Zeichnungen beschrieben. In dieser ist. gezeigt durch: 

Fig. 1 ein erf indungsgemafies Zellelementef eld, 

5 Fig. 2a ein Detail hiervon, 

Fig. 2b, c das Detail von Fig. 2a wahrend verschiedener 

Datenverarbeitungszeiten, 
Fig. 3 eine alternative Ausf uhrungsf orm des Details 

von Fig. 2, 

10 Fig. 4 eine besonders bevorzugte Variante des 

Details, 

Fig. 5 ein Beispiel fur die Funktionsf altung auf 

eine Funktionszellen-Speicherzellen-Kombi- 
nation der Erfindung, 
15 Fig. 6a ein Beispiel einer sequenziell-parallelen 

Datenverarbeitung, 
Fig. 6b ein besonders bevorzugtes Ausf uhrungsbeispiel 

der Erfindung, 

Fig. 7 eine Alternative zu einer Funktionsf altungs- 

20 einheit . 

Nach Fig. 1 umfafit ein allgemein mit 1 bezeichnetes Zellele- 
mentefeid zur Datenverarbeitung 1 Funktionszellmittel 2 zur 
Ausfiihrung von arithmetischen und/oder logischen Funktionen 
25 sowie Speicherzellmittel 3, um Inf ormationen zu empfangen, 
abzuspeichern und/oder auszugeben, wobei eine Steuerverbin- 
dung 4 von Funktionszellen 2 zu den Speicherzellen 3 gefuhrt 
ist . 

30 Das Zellelementef eld 1 ist in der Vernetzung der Elemente 2, 
3, 4 frei konf igurierbar , und zwar ohne den laufenden Betrieb 
nicht neu zu konf igurierender Zellelementeteile zu storen. 
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10 



Dabei konnen die Verbiridungen konf iguriert werden, indem Bus- 
systeme 5 wie erforderlich geschaltet werden. Weiter sind die 
Funktionszellen 2 in ihrer jeweiligen Funktion konfigurier- 
bar. Bei den Funktionszellen handelt es sich urn arithmetische 
Logikeinheiten, die urn bestimmte, Rekonf iguration ermogli- 
chende Schaltkreise erweitert sind, wie Statemachines, 
Schnittstellenbeschaltung zur Kommunikation mit der externen 
Ladelogik 6 usw. Auf die entsprechenden Voranmeldungen des 
Anmelders wird hingewiesen. 



Die Zellelemente 2, 3 des Zellelementef eldes 1 sind zweidi- 
J mensional in Reihen und Spalten angeordnet, wobei jeweils ei- 

ne Speicherzelle 3 unmittelbar neben einer Furiktionszelle 2 
liegt und hier je Reihe drei Speicherzellen-Funktionszellen- 

15 Paare vorliegen, in denen die Funktions- und Speicher zellen 
jeweils uber Steuerverbindungen 4 miteinander verbunden sind. 
Die Funktions- und Speicherzellen 2, 3, bzw. die Kombination 
dieser, weisen Eingange auf, die mit dem Bussystem oberhalb 
der Reihe, in der sich die jeweiligen Zellelemente befinden, 

20 verbindbar sind, urn Daten davon zu empfangen. Weiter weisen 
die Zellen 2, 3 Ausgange auf, die auf das Bussystem 5 unter- 
halb der Reihe Daten ausgeben. Wie noch erlautert werden 
wird, ist uberdies jede Speicherzelle 3 mit einem Ruck- 
wartsregister (BW) versehen, durch welches Daten von dem Bus 

25 unterhalb einer Reihe auf den Bus oberhalb der jeweiligen 
Reihe durchgeschleust werden konnen. 

Das Speicherzellmittel 3 weist zugleich bevorzugt wenigstens 
3 Speicherbereiche auf, namlich einen sogenannten Datenbe- 
30 reich, einen Programmspeicherbereich und eine Stackbereich 
usw. Es kann allerdings in anderen Varianten der Erfindung 
ausreichend sein, lediglich zwei Bereiche vorzusehen, namlich 
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einen Datenspeicher und einen Programmspeicherbereich, die 
jeweils Teil eines Speicher zellmittels bilden konnen. Es ist 
• insbesondere moglich, nicht einf ach eine Trennung eines per 
se homogenen . und hardwareseitig identischen Speicher s in un- 
5 terschiedliche Bereiche vorzunehmen, sondern tatsachlich phy- 
sikalisch bzw. hardwaretechnisch getrennte Speicherbereiche 
vorzusehen. Dabei kann insbesondere auch eine Anpassung der 
Speicherbreite und/oder Tiefe an jeweilige Erf ordernisse vor- 
gesehen werden. Bei Auslegung eines Speichers dergestalt, 

10 dass er im Betrieb einen Programmbereich und einen Datenbe- 
reich aufweist, wird es bevorzugt sein, diesen Speicher bzw. 
Speicherbereich fiir den gleichzeitigen Zugrif f auf Daten- und 
Programmspeicherbereiche auszubilden, etwa als Dual-Port- 
Memory. Es kann auch moglich sein, eng angekoppelte Speicher- 

15 bereiche, insbesondere innerhalb einer Speicherzellmittel- 
Funktionszellmittel-Kombination, die zu einem integrierten 
Bereich gebildet ist, als reinen Cache-Speicher vorzusehen, 
in den insbesondere Daten aus entfernteren Speicherplatzen 
fur den schnellen Zugriff wahrend der Datenverarbeitung vor- 

20 beladen werden. 

Mit Ausnahme der Steuerverbindungen 4 und der zugeordneten 
Schaltungen innerhalb der Funktiohszeilen (ALU in Fig. 2) 
bzw. Speicherzellen (RAM in Fig. 2) handelt es sich bei dem 

25 Zellelementef eld zur Datenverarbeitung von Fig. 1 um ein her- 
kommliches Zellelementef eld, wie es bei rekonf igurierbaren 
Datenverarbeitunsanordnungen, beispielsweise einer VPU ent- 
sprechend der XPP-Technologie des Anmelders gebrauchlich und 
bekannt ist. Insbesondere kann das Zellelementef eld von Fig. 

30 1 wie bekannt betrieben werden, weist also entsprechende Be- 
schaltungen zur Wave-Rekonf iguration, zum Debugging, Ubertra- 
gen von Triggersignalen etc. auf. 



- 18 - 



Akte: PACT 3 4 / PCTEac 




Erste Besonderheiten des Zellelementef eldes der vorliegenden 
' Erfindung ergeben sich. aus der Steuerverbindung 4 und der zu- 
gehorigen Beschaltung, die nachfolgend naher beschrieben wer- 
den wird mit Bezug auf die Fig. 2a-c. Es sei dabei efwahnt, 
5 dass wahrend in Fig. 1 eine Steuerverbindung 4 stets von ei- 
nem weiter links liegende Funktionszellenelement zu einer 
weiter rechts liegenden Speicherzelle gefuhrt ist, und zwar 
nur und genau zu einer solchen Speicherzelle, es einleuchten- 
derweise moglich ist, auch fur die Steuerleitungen eine kon- 

10 figurierbare Vernetzung vorzusehen, urn entweder an anderer 
Stelle liegende Speicherzellen anzusprechen und/o.der um ggf . 
mehr als eine Speicherzelle ansprechen zu konnen, wenn etwa 
in groilem Umfange Speicherbedarf fur Inf ormationen besteht, 
die von den Speicherzellen zu empfangen, abzuspeichern 

15 und/oder auszugeben ist. Aus Grunden der Ubersichtlichkeit 

wird aber in Fig. 1 und 2 lediglich auf fest vorgesehene ein- 
zelne Steuerverbindungen Bezug genommen, was das Verstandnis 
der Erfindung wesentlich erleichtert. Die Steuerverbindung 
ist im ubrigen erf orderlichenf alls durch herkommliche Leitun- 

20 gen, entsprechende Protokolle vorausgeset zt , substituierbar . 

In Fig. 2 ist die Funktionszelle 2 als ALU und die Funktions- 
zelle 3 als RAM bezeichnet. Oberhalb der Reihe, in der die 
Zellen liegen, verlauft der Bus 5a f der das bereits erwahnte 

25 Backward-Register 3a mit den Eingangen 3b der Speicherzelle 
und 2b der ALU verbindet. Das unterhalb der Reihe verlaufende 
Bussystem ist mit 5b bezeichnet und es sind von dem Bussystem 
5a, 5b nur die relevanten Segmente gezeichnet. Es ist erkenn- 
bar, dass das Bussystem 5b alternativ Daten erhalt aus einem 

30 Ausgang 2c der ALU 2, einem Ausgang 3c des RAM 3 und dass es 
Daten in den Eingang 3al des Backward-Registers fuhrt. 
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Die ALU 2 weist zugleich weitere Ein- und Ausgange 2al, 2a2 
auf, die auf andere Bussegmente geschaltet sein konnen und 
liber welche die ALU Daten wie Operanden empfangt bzw. Ergeb- 
nisse ausgibt. 

5 

Die Steuerverbindung 4 befindet sich dauerhaft unter der Kon- 
trolle der erweit.erten Schalt kreise der ALU und stellt hier 
eine Verbindung dar, uber welche eine Vielzahl von Bits liber- 
tragen werden kann. Die Breite der Steuerverbindung 4 ist da- 

10 bei so gewahlt, dass zumindest die folgenden Steuerbef ehle an 
die Speicherzelle iibertragen werden konnen: DATA WRITE, DATA 
READ, ADRESS POINTER WRITE, ADRESSPOINTER READ, PROGRAMMPOIN- 
TER WRITE, PROGRAMMPO INTER READ, PROGRAMMPO INTER INCREMENT, 
STACKPOINTER WRITE, STACKPOINTER READ, PUSH, POP. Die Spei- 

15 cherzelle 3 weist zugleich wenigstens drei Speicherbereiche 
auf, namlich einen sog. Stack-Bereich, einen Heap-Bereich und 
einen Programm-Bereich. Jedem Bereich ist dabei ein eigener 
Zeiger zugeordnet, uber den bestimmt ist, auf welchen Bereich 
des Stacks, des Heaps und des Programmbereiches jeweils le- 

20 send oder schreibend zugegriffen wird. 

Der Bus 5a wird im Zeitmultiplex gemeinsam von den Einheiten 
2 und 3 verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So 
ist in Fig. 2b eine Situation gezeigt, in welcher aus dem 

25 Ausgang 2a2 der ALU-PAE Daten uber das Backward-Register auf 
den Eingang der RAM-Zelle gesandt werden konnen, wohingegen 
der zeitgleich bestehenden, wenngleich nicht benutzten Ver- 
bindung zwischen dem Ausgang 3c des RAM zum Bus 5b und der 
Verbindung zwischen dem Ausgang des Backward-Registers BW zum 

30 Eingang 2b der ALU-PAE zum Zeitpunkt von Fig. 2b keine Bedeu- 
tung zukommt, weshalb diese gestrichelt angedeutet sind. In 
Fig. 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem die 
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Speicherzelle 3 uber ihren Ausgang 3c aus dem uber Steuerlei- 
tung 4 bestimmten Speicherbereich Stack, Heap Oder Program 
die Information uber das Backward-Register an den Eingang 2b 
der ALU-PAE 2 speist, wahrend der Ausgang der ALU-PAE 2c in- 
5 aktiv ist und am Eingang 3b der RAM-PAE kein Signal empfangen 
wird. Aus diesem Grund sind die entsprechenden Verbindungen 
strichpunktiert und somit als inaktiv dargestellt. 

Innerhalb der RAM-Zelle 3 ist eine Schaltung 3d vorgesehen, 
10 in der die liber die Steuerleitung 4 bzw. das Steuerleitungs- 
bussegment 4 empfangene Information decodiert wird. 

Die Erfindung wird verwendet wie folgt: 

15 Zunachst empfangt die ALU 2 Konf igurationsinf ormation von ei- 
ner zentralen Ladelogik, wie im Stand der Technik bereits be- 
kannt. Die Inf ormationsubertragung kann in per se bekannter 
Weise unter Verwendung des RDY/ACK-Protokolls und dergleichen 
geschehen. Auf die Moglichkeit, bei der Ladelogik einen FIL- 

20 MO-Speicher usw. vorzusehen, urn eine ordnungsgemaJie Konfigu- 
ration der Anordnung zu ermoglichen, wird hingewiesen. 

dr~^ Mit den Daten fur die Konf iguration der ALU 2 wird zugleich 

eine Reihe von Daten aus der Ladelogik ubertragen f die ein 

25 sequenzerartig abzuarbeitendes Programm bzw. Programmteil 
darstellt. Verwiesen wird hierzu nur beispielhaft auf Fig. 
6a, bei welcher die HUFFMANN-Codierung als zentraler sequen- 
zieller Teil einer per se datenf lussartig erfolgenden MPEG4- 
Codierung dargestellt ist. Die ALU gibt deshalb wahrend ihrer 

30 Konf iguration auf der Leitung 4 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schreiben auf einen vorgege- 
benen Wert innerhalb des RAM setzt. Danach werden von der 
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Ladelogik bei der ALU empfangene Daten uber den Ausgang 2c 
liber den Bus 5bl und das Backward-Register 3a gespeist und 
gelangen von dort in den Eingang 3b der RAM-PAE 3. Von der 
Einheit 3d werden entsprechend des Steuerbef ehls auf Steuer- 
5 leitung 4 dahn Daten auf den angewiesenen Programmspeicher- 
platz geschrieben. Dies wiederholt sich, bis samtliche, von 
der Ladelogik bei der Konf iguration empf angenen Programmteile 
in der Speicherzelle 3 abgelegt sind. Wenn dann die Konf igu- 
ration der ALU beendet ist, wird diese durch Ausgabe der ent- 

10 sprechenden Befehle auf der Steuerleitung 4 die nachsten, von 
ihr sequenzerartig abzuarbeitenden Programmschritte anfordern 
und uber den Ausgang 3c, den Bus 5b, das Backward-Register 
der RAM-PAE 3 und den Bus 5a an ihrem Eingang empfangen. Wah- 
rend der Programmabarbeitung konnen dabei Situationen auftre- 

15 ten, bei denen Sprunge innerhalb des Programmspeicherberei- 
ches erforderlich sind, Daten in die ALU-PAE aus der RAM-PAE" 
geladen werden, Daten im Stack abgelegt werden mussen usw. 
Die diesbezugliche Kommunikation zwischen ALU-PAE und RAM-PAE 
erfolgt iiber die Steuerleitung 4, so dass die ALU-PAE zu je- 

20 dem Zeitpunkt die Dekodierung durchfiihren kann. Uberdies kon- 
nen auch, wie bei einem herkommlichen Mikroprozessor, Daten 
aus einem Stack oder einem anderen RAM-Speicherbereich emp- 
fangen werden und es konnen uberdies Daten von aufterhalb als 
Operanden in der ALU-PAE empfangen werden. 

25 

Es findet dabei die Abarbeitung der Programmsequenz statt, 
die in den RAM-PAE durch die Ladelogik vorkonf iguriert wurde. 
In der ALU-PAE wird dabei zugleich, wie per se erforderlich, 
eine Bef ehlsdecodierung vorgenommen. Dies geschieht mit den 
30 per se gleichen Schalt kreisen, die schon fur die Decodierung 
der von der Ladelogik erhaltenen Befehle verwendet werden. 
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Es wird liber die ALU zu jedem Zeitpunkt die Steuerleitung 4 
kontrolliert , dass die RAM-Zelle stets genau die Art des 
Speicherzugrif f es befolgt, die von der ALU vorgegeben ist. 
Auf diese Weise ist sichergestellt , dass ungeachtet der Zeit- 
multiplex-Benutzung der Buselemente 5a, b jederzeit den in. 
der Sequenzerstruktur vorhandenen Elementen vorgegeben ist, 
ob auf den Bussen Adressen fur zu holende und/oder zu schrei- 
bende Daten Oder Codes liegen oder ob und gegebenenf alls wo- 
hin Daten zu schreiben sind etc. 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unter- 
schiedliche Arten. erweitert oder. verandert werden. Besonders 
relevant sind die in Fig. 3, 4 und 6 dargestellten Varianten. 



15 Nach Fig. 3 ist zur Verbindung von oberen und unteren Bussen 
nicht nur ein Backward-Register an der RAM-PAE vorgesehen, 
sondern es sind auch ein Vorwarts-Register an der RAM-PAE und 
Vorwarts- und Riickwarts-Register an der ALU-PAE vorhanden. 
Diese konnen, wie durch die Mehrf ach-Pf eile angedeutet, dazu 

20 dienen, von anderen Einheiten, wie externen Hosts, externen 
Peripherie-Geraten wie Festplatten, Hauptspeicher und der- 
gleichen und/oder von anderen Sequenzerstrukturen, PAEs, RAM- 
PAEs etc. Daten zu empfangen und an diese zu senden. Wenn ein 
entsprechender Anf orderungsbef ehl fur neue Programmteile aus 

25 der Sequenzerstruktur, die durch die ALU-PAE und die RAM-PAE 
gebildet ist, abgesandt wird, ist es moglich, Programmblocke 
in der Sequenzerstruktur abzuarbeiten, die weit grofier sind 
als jene, die in der RAM-PAE speicherbar sind. Dies ist ins- 
besondere bei komplexen Datenverarbeitungsauf gaben, Sprungen 

30 liber weite Bereiche, insbesondere in Unterprogramme usw. von 
massivem Vorteil. 
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Eine noch weiter bevorzugte Variante ist in Fig. 4 gezeigt. 
Hier kommuniziert die ALU-PAE nicht nur mit einer RAM-PAE, 
sondern. zugleich mit einer Input/Output-PAE, die dazu ausge- 
bildet ist, eine Schnittstellenbeschaltung fur die Kommunika- 
5 tion mit externen Bauelementeh vorzusehen, wie Festplatten, 
anderen XPP-VPUs, fremden Prozessoren und Coprozessoren usw. 
Wiederum ist die ALU-PAE die Einheit, die als Master fur die 
als „CMD" bezeichnete Steuerverbindung arbeitet und wiederum 
werden die Busse in Multiplex-Weise verwendet . Auch hier kann 
10 eine Ubertragung von Daten von dem Bus unterhalb der Reihe in 
den Bus oberhalb der Reihe durch das Backward-Register erfol- 
C.) gen. 

Die in Fig. 4 gezeigte Anordnung ermoglicht es r externe Zu- 
15 griffe auf nicht in der Speicherzelle RAM-PAE abspeicherbare 
Inf ormationen besonders leicht zu gestalten und ermoglicht 
damit.eine Anpassung der Sequenzerstruktur an bestehende, 
herkommliche CPU-Technologien und deren Betriebsverf ahren in 
noch starkerem Mafie insoweit, als nun in der Eingabe- 
20 Ausgabezelle Adressubersetzungsmittel, Speicherverwaltungs- 
einheiten (MMU-Funktionen) und dergleichen implementiert sein 
konnen. Die RAM-PAE kann hier etwa als Cache, insbesondere 
ab.er als vorgeladener Cache dienen. 

25 Es sei darauf hingewiesen, dass mehrere Sequenzerstrukturen 
gleichzeitig in ein und dasselbe Feld hineinkonf iguriert wer- 
den konnen, dass Funktionszellen, Speicherzellen und ggf . 
Ein-Ausgabezellen wahlweise fur Sequenzerstrukturen und/oder 
eine fur die XPP-Technologie herkommliche Weise konfiguriert 
30 werden konnen und dass es ohne weiteres moglich ist,. dass ei- 
ne ALU an eine andere ALU Daten ausgibt, die diese in einer 
Sequenzer-Weise konf igurieren und/oder zum Teil eines Zellel- 
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mentefeldes machen, mit dem eine bestimmte. Konf iguration ab- 
gearbeitet wird. Auf diese Weise wird dann gegeberienf alls 
auch die Ladelogik entbehrlich. 

5 Nach Fig. 6 sind zwei Ausf uhrungsf ormen der Erfindung in ein 
und demselben Zellelementef eld vereinigt, namlich an den Ran- 
dern aus jeweils zwei PAEs, namlich je einer RAM- und einer 
ALU-PAE gebildete Sequenzer, und im Inneren mit integrierten 
RAJM-ALU- PAEs als integrierten Funktionszellen-Speicherzellen- 
10 einheiten gebildete Sequenzer, wobei es moglich ist, nur ei- 
nen Teil der feldinneren Zellen als Kombinationszellen zu 
bilden. 

Fig. 5 zeigt rechts (Fig. 5c) eine Funktionszell-Speicher- 
15 zellmittel-Kombination . 

GemaB Fig. 5c umfasst eine allgemein mit 50 bezeichnete Funk- 
tionszell-Speicherzellmittel-Kombination Busverbindungen bzw. 
-eingange 51 fur den Eingang von Operanden- und Konfigurati- 

20 onsdaten sowie hier wie insbesondere bevorzugt moglich auch 
Triggersignale (nicht gezeigt) und dergleichen und einen Bu- 
sausgang 52 fur die Ausgabe entsprechender Daten bzw. Signa- 
le. Inner ha lb der Funktionszellmittel-Speicherzellmittel- 
Kombination ist eine ALU 53 vorgesehen, sowie Eingangsregi- 

25 ster RiO bis Ri3 fur Operandendaten und Triggersignal-Ein- 
gangsregister (nicht gezeigt) . Die Konf igurationsdatenregi- 
ster RcO bis Rc7 fur Konf igurationsdaten bzw. ALU-Opcode- 
Daten, Resultatdatenregister Rd0'-R3^ und Ausgangsregister 
RoO bis Ro3 fiir Resultate bzw. auszugebende Triggersignale. 

30 Die Register Rc und Rd fiir die Konf igurationsdaten bzw. Op- 
code-Daten werden von der ALU 53 uber Steuerbef ehlsleitungen 
4 angesteuert und speisen uber geeignete Datenleitungen Daten 
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in die ALU bzw. empfangen aus dieser Resultatdaten . Es ist 
weiter moglich, vom Bus 51 bzw. den Eingangsregistern Ri In- 
formation direkt auf die Ausgangsregister bzw. den Bus 52 zu 
speisen, genau so wie aus den Datenregistern RdO Informatio- 
nen nicht nur an die ALU, sondern auch an die Ausgangsregi- 
ster gespeist werden konnen. Erf orderlichenf alls konnen Ver- 
bindungen zwischen den Speicherbereichen Rd und Rc vorgesehen 
werden, etwa zur Realisierung der Moglichkeit selbstmodif i- 
zierenden Codes . 



Der Konf igurationsdatenbereich RcO bis Rc7 weist eine Steue- 
rung auf, die es erlaubt, auf Teilen des Bereiches zu arbei- 
ten, und zwar insbesondere wiederholt zyklisch und/oder durch 
Sprunge. Dies erlaubt es, beispielsweise in einer ersten 
15 Teilkonf iguration Befehle, die in RcO bis Rc3 liegen, wieder- 
holt abzuarbeiten und, alternativ, etwa auf Eingang eines 
entsprechenden anderen Triggersignales uber die Busleitung 
51, Konf igurationsbef ehle abzuarbeiten, die in Rc4 bis Rc7 
liegen. Damit ist eine Ausf uhrbarkeit einer Wave-Konf igu- 
20 ration gewahrleistet . Es sei darauf hingewiesen, dass die ab- 
gelegten Konf igurationsbef ehle typisch lediglich Anweisungen 
an die ALU darstellen, nicht jedoch vollstandige Busverbin- 
dungen usw. definieren. 

25 Die in Fig. 5 dargestellte, vorbeschriebene Einheit ist hier 
dazu ausgebildet, mit dem vierfachen Takt betrieben zu wer- 
den, wie eine normale PAE ohne Speicherzellmittel und/oder 
Steuersignalleitungen 4 . 



30 



Um auf der so gebildeten Funktionsf altungseinheit (function- 
folding-unit) sequenzerartig Daten in einem Datenfluss abzu- 
arbeiten, werden zu vorgegebenen Algorithmen zunachst Daten- 
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flussgraphen bzw. -bereiche gemali Fig. 5a erstellt. Dann wer- 
den jeder in dem' Graph abzuarbeitenden Operation Speicherbe- 
reiche RcO zugewiesen, die in den Graph-Teilbereich einstro- 
menden Daten internen Eingangsregistern RiO zugewiesen, die 
Zwischenresultate den Speichern RdO bis Rd3 zugewiesen und 
die Ausgabeergebnisse den Registern Ro. Mit dieser Zuweisung 
wird der Graphbereich auf der Function-Folding-Unit abarbeit- 
bar. Es erfolgt quasi eine Datenf luss-Sequenzer-Transf orma- 
tion durch diese Hardware. 



Es sei in diesem Zusammenhang erwahnt, daft es ganz allgemein 
bevorzugt sein wird, die Anordnung der vorliegenden Erf indung 
dergestalt zu verwenden, daft zunachst fur ein Datenverarbei- 
tungsprogramm mit einem Compiler ein Datenfluft- und ein Kon- 

15 trollf lufigraph erstellt wird, urn dann eine entsprechende Par- 
titionierung vorzunehmen, wobei die durch die Partitionierung 
erhaltenen Stiicke dann ganz oder teilweise zur Abarbeitung 
auf Sequenzer-Einheiten, wie sie z.B. gemali der vorliegenden 
Erf indung gebildet sein konnen, abgearbeitet werden konnen. 

20 Auf diese Weise wird quasi eine datenf lufeartige Datenverar- 
beitung bei Fortschreiten von einer Zelle zur nachsten er- 
zielt, aber innerhalb der Zelle (n) eine sequentielle Abarbei- 
tung bewirkt. Dies ist vorteilhaft, wenn aufgrund der sehr 
hohen Rechenleistung einer Anordnung die Taktfrequenz erhoht 

25 werden soil, urn im Gegenzug die Flache bzw. Anzahl der Zellen 
reduzieren zu konnen. Es sei hierbei auch erwahnt, dali es 
moglich ist, d.iesen transf ormationsartigen Ubergang von einer 
einer rein datenf lufiartigen Daten-Verarbeitung zu einer Da- 
tenf luiiverarbeitung mit lokalsequentiellen Teilen dergestalt 

30 vorzunehmen, daft ein iterativer Prozeli durchlaufen wird, etwa 
dergestalt, daii zunachst eine erste Partitionierung vorgenom- 
men wird und dann, sollte bei dem nachfolgen- 
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den„Zusammenrollen" der partitionierten Teile auf Sequen- 
zereinheiten festgestellt werden, daft zB die auf den Sequen- 
cers oder sonstigen Stellen verfugbaren Ressourcen nicht aus- 
reichen, eine andere, dies berucksichtigende Partitionierung 
5 und ein neuerliches „Zusammenrollen N> vor zunehmen . Bei ge- 
wunscht intensiver Nutzung der Function-Folding-Units kann 
die Registeranzahl gegebenenf alls erhoht werden. 

Es sei auch darauf hingewiesen, dass vorliegend die Register 
10 als Speicherzellmittel oder Teile derselben aufgefasst wer- 
den. Es ist einsichtig, dass durch Vergrolierung der Speicher- 
zellbereiche komplexere Auf gaben insbesondere auch sequenzer- 
artig angeordnet werden konnen, dass aber mit den angegebenen 
geringen Grofien schon wesentliche Teile wichtiger Algorithmen 
15 abgearbeitet werden konnen und zwar mit hoher Effizienz. 

Im vorliegenden Beispiel werden die Funktionsf altungseinhei- 
ten bevorzugt so gebildet, dass Daten durch diese hindurch 
geschaltet werden konnen, ohne in der ALU verarbeitet zu wer- 
.20 den. Dies kann ausgenutzt werden, um ein Pf adbalancing zu er- 
reichen, bei dem etwa Datenpakete uber unterschiedliche Zwei- 
ge verarbeitet und dann (wieder) zusammengef iihrt werden mus- 
sen, ohne dass Forward-Register, wie sie ausder Architektur 
des Anmelders bekannt sind, eingesetzt werden mussen. Zu- 

25 gleich und/oder alternativ ist es moglich, die Datenfluss- 
richtung im Zellelementef eld durch entsprechende Ausrichtung 
von einigen Funktionszellmitteln, Speicherzellmitteln, Funk- 
tionsf altungseinheiten nicht streng in eine Richtung laufen 
zu lassen, sondern in zwei entgegengesetzte Richtungen. So 

30 erhalten z. B. in jeder geraden Reihe die ALUs ihre Eingangs- 
operanden von der linken Seite her und in jeder ungeraden 
Reihe erhalten die ALUs ihre Eingangsoperanden von rechts. 
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Wenn Daten mehrfach durch das Feld gesandt werden mus.sen, ist 
eine solche Anordnung ;. vorteilhaf t : etwa bei ausgewalzten 
Schleif enkorpern usw. Die alternierende Anordnung muss dabei 
auch nicht streng sein. Fur bestimmte Anwendungen konnen an- 
5 dere Geometrien gewahlt werden. So kdnnte in der Feldmitte 
eine andere Laufrichtung als an den Randern gewahlt. werden 
usw. Die Anordnung von Funktionszelleneinheiten gleicher 
Laufrichtung nebeneinander kann bezuglich der Busverbindungen 
vorteilhaf t sein. Es sei darauf hingewiesen, dass die gegen- 
10 laufige Anordnung von mehreren gerichteten Funktionszellen in 
einem Feld und die sich damit ergebende verbesserte Datenver- 
arbeitung unabhangig vom Vorsehen einer Steuerieitung oder 
dergleichen als erfinderisch betrachtet wird. 

15 Eine Alternative zu der in Fig. 5 gezeigten Funktionsf al- 
tungseinheit ist in Fig. 7 gezeigt. 
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Patent anspruche 



1. Zellementef eld zur Datenverarbeitung mit Funktionszell- 
5 mitteln zur Ausfuhrung algebraischer und/oder logischer 

Funktionen und Speicherzellmitteln, urn Information zu 
empfangen, abzuspeichern und/oder auszugeben, dadurch ge- 
kennzeichnet , dass Funktionszellen-Speicherzellen-Kombi- 
nationen gebildet sind, bei denen von den Funktionszell- 
10 mitteln eine Steuerverbindung zu den Speicherzellmitteln 

gef uhrt ist . 

2. Zellementef eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet , dass ein Prozessor, Coprozessor und/oder 

15 Microcontroller mit einer Vielzahl in Funktion und/oder 

Vernetzung rekonf igurierbarer und/oder vorgebbarer Ein- 
heiten wie Funktioiiszellen und/oder Speicherzellen bil- 
det . 

20 3. Zellementef eld nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, dass die Funktionszellen als 
arithmetische Logikeinheiten gebildet sind. 

4. Zellementef eld nach dem vorhergehenden Anspruch, dadurch 
25 gekennzeichnet, dass die arithmetischen Logikeinheiten 

als erweiterte ALUs gebildet sind. 

5. Zellementef eld nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, dass die Speicherzellen zur 

30 fluchtigen und/oder nicht fluchtigen Datenspeicherung 

ausgebildet sind. 
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6. Zellementef eld nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet , dass die Speicherzellen zur Ab- 
speicherung von zu verarbeitenden Daten und/oder von zu 
verarbeitenden Programmschritten ausgebildet sind. 

7. Zellementef eld zur Datenverarbeitung, dadurch gekenn- 
zeichnet, dass die Speicherzellen dazu ausgebildet sind, 
abgespeicherte Inf ormationen auf Ansteuerung der sie 
steuernden Funkt ionszelle direkt und/oder indirekt auf. 
einen zur Funkt ionszelle fuhrenden Bus zu geben. 

8. Zellementef eld nach einem der vorhergehenden Anspriiche, 
worin zumindest einer Speicherzelle und/oder Funktions- 
zelle Register zugeordnet sind, insbesondere ein Back- 
ward-Register, welches im Inf ormationsweg zwischen Spei- 
cherzelle und Funktionszelle angeordnet ist. 

9. Zellementef eld nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, dass die Speicherzelle dazu ange 
ordnet ist, Inf ormationen von der sie steuernden Funkti- 
onszelle, einer Eingabe-Ausgabe-Zelle und/oder einer sie 
nicht steuernden Zelle mit arithmetischer Logikeinheit z 
empf angen". 

10. Zellementef eld nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, dass der Funktionszellen- 
Speicherzellen-Kombination zumindest ein Ein-Ausgabe- 
Mittel zugeordnet ist, urn Inf ormationen an eine externe 
Einheit und/oder eine andere Funktionszelle, Funktions- 
zellen-Speicherzellen-Kombination und/oder Speicherzelle 
zu senden und/oder von dieser zu empf angen. 
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.11. Zellementef eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet , dass das Ein-Ausgabe-Mittel gleichfalls 
zum Empfang von Steuerbef ehlen. aus der Funktionszelle 
ausgebildet ist. 

12. Zellementef eld nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet , dass die Steuerung dazu ausgebil- 
det ist, zumindest einige, bevorzugt alle der nachfolgen- 
den Befehle zu iibertragen und/oder die Speicherzelle bzw. 
Eingabe/Ausgabe-Zelle dazu ausgebildet ist, die folgenden 
Befehle zu dekodieren: DATA WRITE /READ, ADRESS POINTER 
WRITE/READ, PROGRAMMPOINTER WRITE/READ, PROGRAMMPOINTER 
INCREMENT, STACKPOINTER WRITE/READ, vorgenannte Befehle 
jeweils insbesondere fur internen und/oder externen Zu- 
griff, PUSH, POP, OPCODE, FETCH. 

13. Zellementef eld nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, dass die Funktionszelle als al- 
leiniger Master auf die Steuerverbindung und/oder das als 
Steuerungsverbindung dienende Bussegment zugreifen kann. 

14. Zellementef eld zur Datenverarbeitung nach einem der vor- 
hergehenden Anspriiche, dadurch gekennzeichnet, dass die 
Funktionszelle zumindest einer von Speicherzelle und Ein- 
Ausgabezelle benachbart angeordnet ist. 

15. Zellementef eld nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, dass die Zellelemente multidimen- 
sional angeordnet sind, insbesondere matrixartig, wobei 
die Funktionszelle und/oder die benachbarte Speicher- 
bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten emp- 
fangen und in eine untere Reihe Daten ausgeben kann, wo- 
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bei. in einer Reihe Busse vorgesehen sind und die Funk- 
tionszelle und zumindest eine Speicher- und/oder Ein- 
Ausgabezelle in ein und derselben Reihe liegen. 

5 16. Verfahren zum Betrieb eines Zellelementef eldes, insbeson 
dere multidimensionalen Zellelementef e.ldes mit Funktions 
zellen zur Ausfiihrung algebraischer und/oder logischer 
Funktionen und Inf ormationsbereitstellungszellen, insbe- 
sondere Speicherzellen und/oder Ein-Ausgabezellen zum 

10 Empfangen und/oder Ausgeben von Inf ormationen und/oder 

Speichern derselben, dadurch gekennzeichnet , dass zumin- 
dest eine der Funktionszellen Steuerbef ehle an zumindest 
eine Inf ormationsbereitstellungszelle. ausgibt, dort im 
Ansprechen auf die Steuerbef ehlinf ormation fur die Funk- 

15 tionszelle verarbeitet wird und die Funktionszelle dazu 

ausgebildet 1st, eine weitere Datenverarbeitung im An- 
sprechen auf aus der Inf ormationsbereitstellungszelle be 
reitgestellte Information durchzuf uhren, um so sequenzer 
artig Daten zu verarbeiten. 

20 

17. Verfahren nach einem der vorhergehenden Anspruche, da- 
durch gekennzeichnet, dass die Funktionszelle dazu ausge 
bildet ist, zumindest einige der Steuerbef ^hle 
OPCODE FETCH, 

25 DATA WRITE INTERN, 

DATA WRITE EXTERN, 
DATA READ INTERN, 
DATA READ EXTERN, 
ADRESS POINTER WRITE INTERN, 

30 ADRESS POINTER WRITE EXTERN, 

ADRESS POINTER READ INTERN, 
ADRESS POINTER READ EXTERN, 
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PROGRAMMPOINTER. WRITE INTERN, 
PROGRAMMPOINTER WRITE EXTERN, 
PROGRAMMPOINTER READ INTERN, 
PROGRAMMPOINTER READ EXTERN, 
5 STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
STACKPOINTER READ INTERN, 
STACKPOINTER READ EXTERN, 
PUSH, 
10 POP, 

PROGRAMMPOINTER INCREMENT 
CI) ausgibt und im Laufe des Zellementbetriebs zumindest ei- 

nige, insbesondere alle der oben genannten Steuerbef ehle 
wie erforderlich ausgibt. 

15 
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Zusammenf as sung 

Die Erfindung betrifft ein Zellementef eld zur Datenverarbei- 
5 tung mit Funktionszellmitteln zur Ausfuhrung algebraischer 

und/oder logischer Funktionen und Speicherzellmitteln, um In- 
formation zu empfangen, abzuspeichern und/oder auszugeben. 
Hierbei ist vorgesehen, dass Funktionszellen-Speicherzellen- 
Kombinationen gebildet sind, bei denen von den Funktionszell- 
10 mitteln eine Steuerverbindung zu den Speicherzellmitteln - ge- 
fuhrt ist. 




(Fig. 1) 

15 
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